讯飞同传造假,人工智能还是人“供”智能?
记者|王欣怡 孙柔柔 微信编辑|李尔祺
2018年9月20日,用户名“Bell Wang”的同传译员在知乎发表了一篇名为《科大讯飞,你的AI同传操(qi)作(zha)能更风骚一点吗》的文章,称现场同传“被AI”。科大讯飞的语音翻译技术确实在国内算得上独领风骚,就在2018创新与新兴产业发展国际会议(IEID)上,讯飞董事长刘庆峰骄傲地宣布,讯飞的语音翻译已经是历史上第一个达到大学6级的口语水平。
讯飞听见的,是嘉宾还是译员?
可是,让BellWang控诉被“AI”的,也正是这一场会议中使用的“讯飞听见”智能会议系统。
9月20日,Bell Wang来到上海国际会议中心,为此次会议的高端装备技术与产业分会做现场同传。Bell在文章中指出,自己事先并不知道现场有语音识别的字幕来“配合”自己的工作。
Bell本以为讯飞与人类译员是分开各自翻译的,但仔细审视字幕后,他却意识到字幕上显示的正是自己和搭档输出的译文,甚至还有一些错漏,比如把“Davos Forum”打成了“Devils Forum”。更让人没想到的是,随后Bell发现该大会在网络平台上的直播,给出的实时同传并非女搭档的声音,而是机器人声。
换句话说,观众在现场大屏幕上看到的字幕转换以及在网络直播中所看到的“AI同传”流程是:嘉宾说话——人类同传译员翻译、说出译文——讯飞听见识别人类说出的译文——译文被转写投放到屏幕和直播中,直播中播出合成的机器合声。
在休息的间隙,Bell收到了朋友发给他的大会直播介绍,上面写着:“知领直播引入科大讯飞智能语音识别技术,实现了国际高端会议的中英文频道切换、智能翻译和自动语音播报,带给你不一样的视听体验。”看到这里的Bell忍无可忍,在愤怒之下发文揭发科大讯飞“所谓智能翻译的真相”,指出科大讯飞只有识别、没有翻译,且识别未征得同传译员的允许。
(图片来源:BellWang)
开幕式大会对人工耦合的解释,这是事先告知?
此文一发,一石激起千层浪,文章一度登上了知乎的热榜第四。据集微网对科大讯飞的采访,19日大会开幕式上科大讯飞董事长刘庆峰已就人机耦合翻译模式进行了说明。刘庆峰表示,可能是分会场的主持人忘了说明,造成分会场的译员“误会”科大讯飞故意造假。
根据国际会议口译员协会 AIIC 规定:未向译员说明、未征得译员同意,不得对其翻译录音。(NO INTERPRETER MAY BE RECORDED WITHOUT HIS/HER KNOWLEDGE AND WITHOUTHIS/HER CONSENT.)这也是Bell Wang和他的同行们最大的怒点所在:科大讯飞并未事先知会译员“讯飞听见”会语音识别译员的译文打成字幕,更不用说直播中用语音合成的机器人音朗读译员的译文一事。
(来源:https://aiic.net/page/58/memorandum-concerning-the-use-of-recordings-of-interpretation-at-conferences/lang/1)
9月21日晚18点30分左右,科大讯飞发表了题为《关于所谓的“同传造假”,我们有话说》(下称《关于》)的情况说明。声明中指出,“科大讯飞智能会议系统”可提供语音转写成文字并在屏幕上同步的功能,同时也可以提供翻译服务。翻译服务主要是两种方案:一种全自动翻译,现场机器翻译并同步显示在屏幕上,没有任何人工同传参与;另一种是人机耦合翻译模式,由机器提供语音转写和翻译结果给同传参考,辅助同传降低工作强度并提升效率。
(讯飞声明全文)
然而, Bell Wang的同事艾珂却并不认同这种“人机耦合”的模式能够提高效率的说法。艾珂指出,目前语音识别技术将人类译者的口译转换为文字时,还做不到百分百的正确识别,对专业术语尤是。如果识别出的关键字显示错误,一方面会影响听众的理解;另一方面,对于同传译员来说也是干扰。在语音识别将口译转换为文字后,显示在字幕上会有延后,这会导致译员在翻译时可能会分神注意到自己几秒前说过的话,导致思路被打断,反而导致效率下降。
此外,就Bell质疑的知识产权保护问题,科大讯飞董秘、副总裁江涛回应:“一场会开下来,产生了这么多内容。音频视频,还有对应的翻译,内容版权归属可以找相关的法律认识咨询一下。但我觉得一定跟主办方有关系。”
但是,据查证,中国作为缔约国之一的《保护文学和艺术作品伯尔尼公约》中规定,演讲人对演讲拥有知识产权,翻译在与演讲人知识产权不冲突的情况下对翻译内容拥有产权。因此,未经许可将翻译内容上屏、在网络端直播,用合成语音读出来直播,都属于侵犯知识产权的行为。
被“人机耦合”?不是第一次
《关于》一文中还强调,此次事件是 “某位同传译员对科大讯飞产生了误解,是对会议服务方面的沟通了解不清”,并称“希望尽快消除误解”。然而,类似的“误解”对于同传译员们来说却不是第一次了。
Bell Wang的同事甄艾在最近的某次中外交流会议上也被“人机耦合”了一把。她到达会场后才被告知,现场不会为观众发放耳机,而是由科大讯飞将译员翻译的中文转录投放到大屏幕上。但多处出错的译文转写、逐字闪现的字幕让与会者观感疲惫,并向主办方提出异议。主办方只能在茶歇时宣布紧急借调同传耳机,取消了大屏幕的字幕显示,会议后程以耳机接受译文的方式进行。在此过程中,科大讯飞的员工除了简单告知之外,和她没有任何沟通,也没有主动告知听众字幕是转录自她的翻译。
9月17日,陈步在一个以人工智能为主题的会议中担任同传口译工作。事前他将与腾讯的AI同传并头进行工作。据他透露,AI同传与同传译员并线分头为观众服务的情况,常常出现在AI所属的科技公司参与发言或赞助,或是背景为人工智能研讨的会议上。由于同传译员们一般都是从相熟的翻译中介公司接到委派,与主办方的直接沟通较少,事前不知情的现象不算罕见。
张正奇是英汉同传业内公认的“大牛”。今年8月31日,他拟定了一份《关于拒绝配合“人工智能同传”造假的声明》发布在他组建的同传译员微信群中,呼吁译员们签字。《声明》中列举的第一条写道:“口译员、翻译公司、同传设备公司、人工速记公司欢迎真正的技术进步,反对造假,反对以资本力量为(注:应为危)害社会”。两年间,就他所知的译员拒绝按科技公司要求与人工智能翻译系统“演双簧”的情况至少有五次。
(图片来源:张正奇)
拥抱技术,但拒绝夸大的技术
2017年,科大讯飞推出了产品“晓译翻译机”,号称“口袋里的翻译官”。6月25日,一篇名为《刚刚宣告:同声传译即将消亡!》的文章刷爆了同传译员们的朋友圈。
两日后,科大讯飞发布了一篇《拒绝神化:人工智能技术需踏实前行》的声明,声明中强调:“讯飞一直所努力的,是希望通过语音转写和翻译技术帮助同传提高工作效率、减少失误,形成人机耦合的同传新模式,并不是去替代同声传译。”可是,陈步的朋友仍在最近的一次会议茶歇时被与会者问道,“不是都有机器翻译了吗?怎么还有人工翻译呢?”
9月22日13点34分,张正奇在朋友圈写道:“某飞的人机耦合是伪命题,因为同传工作路径与某飞工作路径平行,怎么耦合?两列齐头并进的火车,怎么耦合?同传译员边听边译,人工智能识别采用的信号起始点与译员的起始点一模一样。您不比我们快,您的车头不可能站我们前边拉火车。站我们后面,我们又不需要你了。”
陈步说,“译员和任何人一样都拥抱技术,但不接受夸大的技术”。Bell Wang的同事们也对未来“人机耦合”的愿景表示期待,虽然,在他们眼中,科大讯飞并没有展露出足够的诚意让他们的“机”与译员耦合。
自人工智能出现以来,人类和人工智能的关系就一直是讨论的焦点。近到能“猜心”的网易云个性化歌单推荐,远及AlphaGo下赢国手柯洁的那一步棋,人工智能的崛起速度确实超乎了许多人的想象。海知智能CEO谢殿侠在近日接受猎云网的采访时说,“这一次的变革可能更多是语言、视觉、知识,然后这些跟我们过去引以为傲的东西也可以机器化,在可以想像的未来,机器可以全方位超过我们人类。”
然而,这次的人“供”智能事件却提示我们,这一天的到来还没有那么触手可及。Bell Wang也在其文章的最后写道,“也许有一天AI真的能做到理解自然语言,也许有一天我们这个职业会失业,但绝不是现在”。
9月21日,卡耐基梅隆大学计算机学院副院长贾斯汀·卡塞尔(Justine Cassell) 在“2018网易未来科技峰会”上做了题为《人工智能的未来机遇与惊喜》的演讲。演讲的最后,她总结道, AI的未来其实是掌握在人类手中,而不是人类不可抗拒的命运,“我们可以决定怎么样使用AI,使用它们给我们带来的机遇,到底是走向一个光明还是黑暗的未来”。
(应受访者要求,以上人物皆为化名)
推荐阅读
我们持续邀请在职媒体人开展讲座,可以留下你最想听的人的名字或者供职单位
听说,有趣的人都关注了我们